import requests
from bs4 import BeautifulSoup

# 创建start_num变量用于翻页，由于每页是25个，所以步长是25
for start_num in range(0, 250, 25):
    headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36 Edg/114.0.1823.43"
    }
    #  将模拟翻页变量传入url
    url = f"https://movie.douban.com/top250?start={start_num}"
    #  发送请求，获取相应
    response = requests.get(url=url, headers=headers)
    #  将数据转换成文本格式
    text = response.text
    #  将text传入BeautifulSoup，以便从text里搜寻想要的信息
    soup = BeautifulSoup(text, "html.parser")  # 配置html的解释器
    #  找共同点：右击检查可以发现所有电影名字都被包含在span里面，且所有class的值都为title
    all_title = soup.find_all("span", attrs={"class": "title"})
    #  先利用for循环遍历
    for title in all_title:
        #  这里输出不仅有中文名，还有其他跟在/后面的英文名
        title_string = title.string
        #  用if语句做判断，只将中文名输出
        if '/' not in title_string:
            print(title_string)